Ma trận thưởng phạt Song_đề_tù_nhân

Ma trận thưởng phạt của song đề tù nhân có thể viết bằng nhiều cách, miễn là theo những nguyên lý sau đây:

T > R > P > S

trong này, T là động cơ đào ngũ (temptation - khi đào ngũ và người kia hợp tác); R là phần thưởng khi cả hai đều hợp tác (reward); P là sự trừng phạt khi cả hai đều đào ngũ (punishment); và S là phần bị lãnh khi hợp tác và người kia đào ngũ (sucker's payoff).

(Các giá trị số phải được chọn để T + S < 2R để trò chơi được đáng kể).

Công thức trên bảo đảm rằng bất kỳ số nào được chọn, lựa chọn đào ngũ cũng lúc nào cũng tốt hơn bất chấp lựa chọn của người kia.

Theo nguyên lý này, chúng ta lấy được ma trận thưởng phạt chuẩn thường được nêu ra trong các bài viết về đề tài này. Trong cách trình bày này, số càng lớn thì kết quả càng tốt.

Ma trận thưởng phạt chuẩn
Hợp tácĐào ngũ
Hợp tác3, 30, 5
Đào ngũ5, 01, 1

Trong thuật ngữ "thắng-thắng" ma trận sẽ giống như sau:

Hợp tácĐào ngũ
Hợp tácthắng-thắngthua nhiều-thắng nhiều
Đào ngũthắng nhiều-thua nhiềuthua-thua